8 resultados para Bioinformática

em Universidade Complutense de Madrid


Relevância:

20.00% 20.00%

Publicador:

Resumo:

En los últimos años se ha incrementado el interés de la comunidad científica en la Factorización de matrices no negativas (Non-negative Matrix Factorization, NMF). Este método permite transformar un conjunto de datos de grandes dimensiones en una pequeña colección de elementos que poseen semántica propia en el contexto del análisis. En el caso de Bioinformática, NMF suele emplearse como base de algunos métodos de agrupamiento de datos, que emplean un modelo estadístico para determinar el número de clases más favorable. Este modelo requiere de una gran cantidad de ejecuciones de NMF con distintos parámetros de entrada, lo que representa una enorme carga de trabajo a nivel computacional. La mayoría de las implementaciones de NMF han ido quedando obsoletas ante el constante crecimiento de los datos que la comunidad científica busca analizar, bien sea porque los tiempos de cómputo llegan a alargarse hasta convertirse en inviables, o porque el tamaño de esos datos desborda los recursos del sistema. Por ello, esta tesis doctoral se centra en la optimización y paralelización de la factorización NMF, pero no solo a nivel teórico, sino con el objetivo de proporcionarle a la comunidad científica una nueva herramienta para el análisis de datos de origen biológico. NMF expone un alto grado de paralelismo a nivel de datos, de granularidad variable; mientras que los métodos de agrupamiento mencionados anteriormente presentan un paralelismo a nivel de cómputo, ya que las diversas instancias de NMF que se ejecutan son independientes. Por tanto, desde un punto de vista global, se plantea un modelo de optimización por capas donde se emplean diferentes tecnologías de alto rendimiento...

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Predecir la función biológica de secuencias de Ácido Desoxirribonucleico (ADN) es unos de los mayores desafíos a los que se enfrenta la Bioinformática. Esta tarea se denomina anotación funcional y es un proceso complejo, laborioso y que requiere mucho tiempo. Dado su impacto en investigaciones y anotaciones futuras, la anotación debe ser lo más able y precisa posible. Idealmente, las secuencias deberían ser estudiadas y anotadas manualmente por un experto, garantizando así resultados precisos y de calidad. Sin embargo, la anotación manual solo es factible para pequeños conjuntos de datos o genomas de referencia. Con la llegada de las nuevas tecnologías de secuenciación, el volumen de datos ha crecido signi cativamente, haciendo aún más crítica la necesidad de implementaciones automáticas del proceso. Por su parte, la anotación automática es capaz de manejar grandes cantidades de datos y producir un análisis consistente. Otra ventaja de esta aproximación es su rapidez y bajo coste en relación a la manual. Sin embargo, sus resultados son menos precisos que los manuales y, en general, deben ser revisados ( curados ) por un experto. Aunque los procesos colaborativos de la anotación en comunidad pueden ser utilizados para reducir este cuello de botella, los esfuerzos en esta línea no han tenido hasta ahora el éxito esperado. Además, el problema de la anotación, como muchos otros en el dominio de la Bioinformática, abarca información heterogénea, distribuida y en constante evolución. Una posible aproximación para superar estos problemas consiste en cambiar el foco del proceso de los expertos individuales a su comunidad, y diseñar las herramientas de manera que faciliten la gestión del conocimiento y los recursos. Este trabajo adopta esta línea y propone MASSA (Multi-Agent System to Support functional Annotation), una arquitectura de Sistema Multi-Agente (SMA) para Soportar la Anotación funcional...

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La cantidad de datos biológicos y médicos que se produce hoy en día es enorme, y se podría decir que el campo de las ciencias de la vida forma parte ya del club del Big Data. Estos datos contienen información crucial que pueden ayudar a comprender mejor los mecanismos moleculares en los sistemas biológicos. Este conocimiento es fundamental para el progreso en el diagnóstico y en el tratamiento de las enfermedades. La Bioinformática, junto con la Biología Computacional, son disciplinas que se encargan de organizar, analizar e interpretar los datos procedentes de la Biología Molecular. De hecho, la complejidad y la heterogeneidad de los problemas biológicos requieren de un continuo diseño, implementación y aplicación de nuevos métodos y algoritmos. La minería de datos biológicos es una tarea complicada debido a la naturaleza heterogénea y compleja de dichos datos, siendo éstos muy dependientes de detalles específicos experimentales. Esta tesis se basa en el estudio de un problema biomédico complejo: la menor probabilidad de desarrollar algunos tipos de cáncer en pacientes con ciertos trastornos del sistema nervioso central (SNC) u otros trastornos neurológicos, y viceversa. Denominamos a esta condición como comorbilidad inversa. Desde el punto de vista médico, entender mejor las conexiones e interacciones entre cáncer y trastornos neurológicos podría mejorar la calidad de vida y el efecto de la asistencia médica de millones de personas en todo el mundo. Aunque la comorbilidad inversa ha sido estudiada a nivel médico, a través de estudios epidemiológicos, no se ha investigado en profundidad a nivel molecular...

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Research on temporal-order perception uses temporal-order judgment (TOJ) tasks or synchrony judgment (SJ) tasks in their binary SJ2 or ternary SJ3 variants. In all cases, two stimuli are presented with some temporal delay, and observers judge the order of presentation. Arbitrary psychometric functions are typically fitted to obtain performance measures such as sensitivity or the point of subjective simultaneity, but the parameters of these functions are uninterpretable. We describe routines in MATLAB and R that fit model-based functions whose parameters are interpretable in terms of the processes underlying temporal-order and simultaneity judgments and responses. These functions arise from an independent-channels model assuming arrival latencies with exponential distributions and a trichotomous decision space. Different routines fit data separately for SJ2, SJ3, and TOJ tasks, jointly for any two tasks, or also jointly for the three tasks (for common cases in which two or even the three tasks were used with the same stimuli and participants). Additional routines provide bootstrap p-values and confidence intervals for estimated parameters. A further routine is included that obtains performance measures from the fitted functions. An R package for Windows and source code of the MATLAB and R routines are available as Supplementary Files.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El presente trabajo tiene su origen en la necesidad de herramientas de apoyo al aprendizaje para los alumnos en las clases de Genética de la Facultad de Biología de la Universidad Complutense de Madrid. En esta asignatura, el equipo docente ha desarrollado aplicaciones para dispositivos móviles destinadas a los alumnos. Las aplicaciones les permiten trabajar con materiales relacionados con aspectos clave de la asignatura. Estas aplicaciones contienen apartados de teoría y ejercicios. Los ejercicios cuentan con asistentes automatizados que guían al alumno para su realización y autocorrección. En su forma actual, las aplicaciones presentan limitaciones tanto desde el punto de vista de su diseño como de la funcionalidad que ofrecen. El actual diseño no aplica las técnicas comunes de Ingeniería del Software respecto a aplicaciones cliente-servidor. Ello las hace difíciles de mantener cuando se plantea abordar nuevas funcionalidades y plataformas, o facilitar la creación de nuevos materiales de la asignatura. Ello ha limitado su expansión para incorporar nuevos tipos de materiales (en particular diferentes tipos de ejercicios), integrarlas con otras herramientas (por ejemplo, el Campus Virtual de la universidad) o permitir un apoyo efectivo a la comunidad de aprendizaje formada por alumnos y docentes (por ejemplo, para que los docentes supervisen la evolución de los alumnos y estos puedan obtener información adicional de los profesores). Para abordar esta situación se propone una aplicación móvil que engobe a todas las aplicaciones anteriores que se habían creado para las clases de Genética. Se utilizará un modelo cliente-servidor para mejorar sus capacidades funcionales, de modo que cumpla con los requisitos establecidos. Entre estos se incluye un control de los usuarios que utilizan la aplicación, y que se optimice la memoria local utilizada por la aplicación, permitiendo así el uso de imágenes más pesadas. Además, este modelo facilitará las tareas de mantenimiento de la aplicación, por ejemplo incluir nuevo material. Por otro lado, también se propone rediseñar la interfaz de la aplicación, de modo que sea más accesible desde el punto de vista de la usabilidad.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El flujo óptico y la estimación de movimiento es área de conocimiento muy importante usado en otros campos del conocimiento como el de la seguridad o el de la bioinformática. En estos sectores, se demandan aplicaciones de flujo óptico que realicen actividades muy importantes con tiempos de ejecución lo más bajos posibles, llegando a tiempo real si es posible. Debido a la gran complejidad de cálculos que siguen a este tipo de algoritmos como se observará en la sección de resultados, la aceleración de estos es una parte vital para dar soporte y conseguir ese tiempo real tan buscado. Por lo que planteamos como objetivo para este TFG la aceleración de este tipo de algoritmos mediante diversos tipos de aceleradores usando OpenCL y de paso demostrar que OpenCL es una buena herramienta que permite códigos paralelizados con un gran Speedup a la par que funcionar en toda una diversa gama de dispositivos tan distintos como un GPU y una FPGA. Para lo anteriormente mencionado trataremos de desarrollar un código para cada algoritmo y optimizarlo de forma no especifica a una plataforma para posteriormente ejecutarlo sobre las diversas plataformas y medir tiempos y error para cada algoritmo. Para el desarrollo de este proyecto partimos de la teoría de dos algoritmos ya existentes: Lucas&Kanade monoescala y el Horn&Schunck. Además, usaremos estímulos para estos algoritmos muy aceptados por la comunidad como pueden ser el RubberWhale o los Grove, los cuales nos ayudarán a establecer la corrección de estos algoritmos y analizar su precisión, dando así un estudio referencia para saber cual escoger.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El objetivo principal del proyecto es desarrollar una plataforma compuesta por aplicaciones educativas gamificadas para el entrenamiento de personal médico en países de recursos limitados en citopatología mediante dispositivos Android de bajo presupuesto. Antes de desplegar la plataforma en países con recursos limitados, va a ser probada en un curso de Introducción a Citopatología de la Escuela Médica de Harvard. El proyecto final debe funcionar tanto en PCs como en dispositivos Android de bajo coste (p.e. 50 dólares americanos, Amazon Kindle Fire 7 pulgadas) y no puede depender de una conexión a internet continua. Se han analizado algunas aplicaciones con propósito de juego y simulaciones gamificadas para tener una base de conocimiento común entre expertos médicos y desarrolladores. También se han estudiado juegos y aplicaciones cuyo objetivo es hacer uso de imágenes médicas para entrenamiento de personal médico o están enfocadas al diagnóstico mediante colaboración por parte de personal no-médico. Esto nos ha permitido identificar las mejores mecánicas de juego para nuestro caso de uso. A continuación, se han comparado diferentes herramientas de edición y motores de juegos desde el punto de vista del rendimiento ofrecido, las plataformas soportadas, su documentación y licencia. Todo ello nos ha permitido elegir la tecnología de desarrollo (libGDX). Finalmente, diseñamos e implementamos un sistema integrado de aplicaciones (editor de contenido y generador de juegos). El sistema está enfocado a reducir la dependencia entre el personal experto y los desarrolladores para crear y mantener contenido educativo. Se trata de una arquitectura formada por un servicio RESTful, y un editor asociado, orientado a la gestión de contenido educativo orientado para citopatología y dos clientes para diferentes plataformas (PC y Android) que consumen dicho servicio. Finalmente, se presentan las conclusiones y el trabajo futuro del proyecto.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Motivation: Influenza A viral heterogeneity remains a significant threat due to unpredictable antigenic drift in seasonal influenza and antigenic shifts caused by the emergence of novel subtypes. Annual review of multivalent influenza vaccines targets strains of influenza A and B likely to be predominant in future influenza seasons. This does not induce broad, cross protective immunity against emergent subtypes. Better strategies are needed to prevent future pandemics. Cross-protection can be achieved by activating CD8+ and CD4+ T cells against highly-conserved regions of the influenza genome. We combine available experimental data with informatics-based immunological predictions to help design vaccines potentially able to induce cross-protective T-cells against multiple influenza subtypes. Results: To exemplify our approach we designed two epitope ensemble vaccines comprising highlyconserved and experimentally-verified immunogenic influenza A epitopes as putative non-seasonal influenza vaccines; one specifically targets the US population and the other is a universal vaccine. The USA-specific vaccine comprised 6 CD8+ T cell epitopes (GILGFVFTL, FMYSDFHFI, GMDPRMCSL, SVKEKDMTK, FYIQMCTEL, DTVNRTHQY) and 3 CD4+ epitopes (KGILGFVFTLTVPSE, EYIMKGVYINTALLN, ILGFVFTLTVPSERG). The universal vaccine comprised 8 CD8+ epitopes: (FMYSDFHFI, GILGFVFTL, ILRGSVAHK, FYIQMCTEL, ILKGKFQTA, YYLEKANKI, VSDGGPNLY, YSHGTGTGY) and the same 3 CD4+ epitopes. Our USA-specific vaccine has a population protection coverage (portion of the population potentially responsive to one or more component epitopes of the vaccine, PPC) of over 96% and 95% coverage of observed influenza subtypes. The universal vaccine has a PPC value of over 97% and 88% coverage of observed subtypes.